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УДК 519.7: 007 + 06 
ОПЕРАТОР $ЕТЕСТ В ЯЗЫКЕ М-ОЕСГАВАТТУЕ ТАМСУАСЕ 


О.В. ОЛЬХОВИК 
(Донской государственный технический университет) 


Описаны синтаксис и семантика оператора 5Е1ЕСТ в языке М-Бедагавуе [апдиаде. Показано, что для каждо- 
го класса в смысле М-модели данных может быть построено отношение, содержащее значения атрибутов, 
информативных на этом классе, а оператор ЗЕЁЕСТ реализует операции реляционной алгебры и другие спе- 
циальные операции над подмножествами этого отношения. 
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Введение. Современные МодЕ|-Чйуеп епдтеетпа (МОЕ) технологии предназначены для улучше- 
ния коммуникаций между участниками проекта и для генерации программного кода на основе 
проектных диаграмм. Однако они повышают стоимость разработки и сопровождения программ из- 
за необходимости тратить усилия отдельно и на поддержку проектных диаграмм, и на создание 
программного кода. Источником проблемы здесь является невозможность полной автоматической 
генерации программного кода, а нотации, предназначенные для кодогенерации, настолько ус- 
ложняются, что их коммуникативная ценность сводится к нулю, и их разработка не менее сложна, 
чем построение кода. 

В статье [1] предложена М№-модель данных, на основе которой разработаны декларатив- 
ный язык запросов М-Бедагайуе 1апдчаде (№01) [2] и визуально-декларативный язык проектиро- 
вания №-\ за! [апдцаде (М\Г.) [3]. Принципы, заложенные в ММ, позволяют сократить цикл про- 
изводства программного обеспечения информационных систем (ПО ИС) посредством полной ав- 
томатической кодогенерации структур данных и бизнес-логики и повысить коммуникативный эф- 
фект за счет более простого и понятного визуально-декларативного языка построения проектных 
диаграмм. 

С другой стороны, стоимость сопровождения ПО ИС может быть существенно снижена пу- 
тем уменьшения количества обращений пользователей за счет самостоятельного решения ими 
информационных задач. Этого можно добиться посредством увеличения числа запросов «а4-Пос», 
выполняемых пользователями без помощи программистов (возможно, с помощью соответствую- 
щих интерфейсов, например, интерактивных отчетов). Перспектива увеличения числа запросов 
«а4-пос», выполняемых пользователями, видится в замене 5$гискигеЯ Очегу Ёапдцаде (501) на 
более простой 5ОЁ-подобный язык без потери выразительной мощности. В качестве такого языка 
предлагается МОЕ. 

Поскольку основным оператором любого языка, оперирующего структурированными дан- 
ными, является оператор выборки 5ЕЦЕСТ, рассмотрению его синтаксиса и семантики в языке МО". 
и посвящена данная работа. 

Синтаксис оператора $ЕЁЪЕСТ в МОЕ [2]. 5ЕЁЕСТ в МОЕ состоит из предложений аналогичных 
предложениям оператором выборки в 501: ЗЕЁЕСТ, ЕВОМ, М/НЕВЕ, СКОУР ВУ, НАММС и ОКРЕВ 
ВУ. Предложение $ЕЁЪЕСТ определяет множество атрибутов, формирующих результат выборки. 
Предложение ЕКОМ определяет источник выборки. Здесь принципиальное отличие МОЕ состоит в 
том, что источником выборки может служить только один класс (или категория), а не набор таб- 
лиц, как в 501. Предложение \М/НЕВЕ определяет предикат, ограничивающий результат выборки. 
Предложение СКОУР ВУ задает группировку, а предложение НА\УПМС ограничивает результат 
группировки предикатом, заданным на ее результате. Предложение ОКРЕК ВУ реализует сорти- 
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ровку результата. При этом сортировка может выполняться только по именованным атрибутам. 
В общем случае синтаксис оператора 5ЕЁТЕСТ в МОЕ таков: 
<выборка> ::= 

$ЕЁЕСТ [РТ ИМСТ] [*] [<операционное задание> [А$ “<имя>”] 

(‚ <операционное задание> [А$ <имя>]..)] 

ЕКОМ <имя> 

ГИ/НЕКЕ <условие>] 

[СКОЦР ВУ <имя> (,<имя>..)] 

[НАИТМС <условие>] 

[ОКРЕК ВУ <имя> [РЕЗС] (‚<имя> [РЕЗС]..)] 
<операционное задание>:.= {(<операционное задание> )| <операнд>} 

[<операция> <операционное задание> ] 
<операция> ::= ОИМТЕК$ФЕСТ/ М1МИ$| ИМОМ/ + -[ *1 ИГ 
<операнд> ::= {<атрибут-операнд>| <значение> | 

<унарная функция>| <бинарная функция>} 
<атрибут-операнд>::={<имя> [{<имя> [РАКЕМТ}. <имя> | <имя>:<имя>} 
<значение>:.={<целое число> | <вещественное число> | <литерал> } 
<бинарная функция>:.= <имя> (<операнд>, <операнд>) 
<унарная функция>::= ПЛМУ/ СОЦМТ/ МПМ/ МАХ/ $ИМ! 

АУС] АМ. |<имя>} (<операнд>) 
<условие> ::= {(<условие>)/ МОТ <условие> [<сравнение>} 

[АМО/ОК} <условие>] 
<сравнение> ::= <операционное задание> {<ге!-ор> <операционное задание> 

/ ВЕТИ/ЕЕМ <значение> АМР <значение> 

/1М№М <операционное задание> | ‘<значение> (,<значение>..)')* 

[ 5ТАКТЛМ№С <значение> 

[ СОМТАИММС <значение> } 

<ге/{-ор>::= {=|[<>|[>[<|=>[<=} 
<имя> ::= <буква>(<буква> |<цифра>) 
<цифра>::= 10,1,2,3,4,5,6,7,8,9} 
<буква>:.= {а..2, А..2, а..я, А..Я, _} 
Семантика оператора $ЗЕТЕСТ в М№О:. Семантику оператора ЗЕТЕСТ определим на основе базо- 
вых конструкций №-модели данных, описанных в [1]. Базовым понятием №-модели является объ- 
ект, который рассматривается как множество образов. Объектам в реальном мире могут соответ- 
ствовать конкретные предметы и явления, а также абстрактные понятия предметной области, 
причем не обязательно вербализованные в естественных языках. Поскольку объекты суть множе- 
ства, на них определены базовые теоретико-множественные отношения и операции. Теоретико- 
множественное отношение нестрогого включения при этом трактуется как отношение наследова- 
ния. Все объекты различимы и индексируются натуральными числами идентифицирующей функ- 
цией 14а: Х > М. 

Свойства объектов определяются атрибутами, которые представляют собой бинарные 
функции, определенные на множестве объектов. Значения каждого атрибута лежат в области оп- 
ределенного тре-типа данных (целые, вещественные числа, литералы и т. д.). На произволь- 
ном объекте атрибут в общем случае возвращает некоторое множество значений одного типа 
данных. Атрибут также может ссылаться на объекты. При этом его значение на объекте в общем 
случае представляет собой множество идентификаторов объектов. 

Поскольку атрибуты -— это функции, они могут задаваться различным способом. Если ат- 
рибут задается перечислением пар <объект, значение>, то он называется исходным. Если атри- 
бут задается формулой, то он считается расчетным. Формулы представляют собой инфиксную 
запись последовательности операций над атрибутами, определенных в [1]. 
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Существует требование к аналитической различимости объектов. Для любой пары раз- 
личных объектов должен существовать хотя бы один исходный атрибут, принимающий на них 
различные значения неравные неопределенности. 

Важным является определение терминальности. Атрибут терминален на объекте, если его 
значения на любом подмножестве объекта равны с точностью до перестановки. Если атрибут не 
терминален на объекте, то его значение на нем представляет собой объединение значений этого 
атрибута на всех его подмножествах. 

Классом называется объект, в котором можно выделить непересекающиеся подмножества 
такие, что существует некоторое непустое множество исходных атрибутов, каждый из которых 
терминален на любом из этих подмножеств. Данные подмножества класса называются его экзем- 
плярами, а множество атрибутов называется множеством атрибутов терминальных на классе. 

Класс наследует от другого класса, если является его подмножеством. При этом каждый 
экземпляр класса-потомка является наследником (подмножеством) строго одного экземпляра 
класса-предка. Наследование может быть простым или кратным. В случае простого наследования 
(будем рассматривать именно такой случай) существует функция РагепЕ: ТА(Х)>1а(Х), которая по 
идентификатору экземпляра возвращает идентификатор его непосредственного предка. 

Множество терминальных атрибутов класса-предка является подмножеством терминаль- 
ных атрибутов класса-потомка. Атрибут определен на классе, если терминален на нем, но не тер- 
минален на любом из его предков. 

В иерархии классов существует верхняя грань — класс хо, являющийся предком любого 
класса. На нем определены все константы (атрибуты, значения которых одинаковы для всех объ- 
ектов), в том числе внешние переменные, которые можно считать константами в любой отдельно 
взятый момент существования базы данных. 

Категория -— это подмножество класса, состоящее из его экземпляров, на которых истинен 
некоторый предикат. Все, что далее будет говориться о классах, может быть обобщено и для ка- 
тегорий. 

База данных представляет собой схему, включающую в себя классы и категории с опреде- 
ленными на них атрибутами, и множество экземпляров классов данной схемы. 

Теперь перейдем непосредственно к семантике оператора ЗЕТЕСТ. Оператор $ЗЕЁЕСТ в 
применении к некоторому классу оперирует атрибутами потока этого класса. 

Пусть С = {с1,со,....С.} пеМ = конечное множество классов, определенное в заданной схе- 
ме. На произвольном классе с, (1<<п) определено некоторое множество атрибутов \; с тем же 
индексом. Множество атрибутов, определенных в классе с, или в его ветви наследования обозна- 
чим: 

О; = {Е / Ге\], < = аубсесус5 С}. 
Множество экземпляров класса с обозначим ЕхКс,). Тогда рекурсивно поток $; класса с; — это 
5, =ОХ) таких, что У; < ©; или 3 д: 
у 


Х > В(ЕХКс,)) & Ех((с,) <= Х & №; < 5х. 
Иными словами, в поток класса входят атрибуты, определенные на нем, или на его предках, или 
на его потомках, или входящие в потоки классов, на которые он ссылается. Поток класса позво- 
ляет определить имена атрибутов, которые доступны в операторе $ЕЁЕСТ, построенном на задан- 
ном классе. 

Помимо значений атрибутов, определенных в ветви наследования класса, или полученных 
из них операцией композиции, оператор ЗЕЁТЕСТ может возвращать значения атрибутов, получен- 
ных в результате применения над атрибутами потока любых других операций, описанных в [1]. 
Определим множество информативных на произвольном классе с атрибутов 9; как множество ат- 
рибутов, соответствующих правилам Р/1 — РА: 
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РТ. ГЕО ТЕ 3. 

Р2. 1 = П(9) = Ее 3, где д е 3, Шт. п Оей, = ©, Пе $. 

РЗ. Е =. 9 => ЕЕ 3, ГДе + — унарная операция или агрегация над атрибутом в смысле [1], 
ЧЕ 3. 

РА. = до | = ЕЕ 3, где о - бинарная или теоретико-множественная операция над атри- 
бутами в смысле [1], д, И е 3.. 

Пусть с, — произвольный класс в базе данных, Ех(с) = {хи,Хо,...,Ха}, 9 = №- множество его 
экземпляров в определенный момент времени, и 3, = {Ё/4,,...Еи}, т е М — множество информа- 
тивных на нем атрибутов. Тогда можно построить отношение 5%, в котором каждый экземпляр х 
класса с, порождает ровно один кортеж (1а(х), РагепКх), №(х), Ь(х),..., и(х)) и никаких других кор- 
тежей не содержится: 

14 | Раге | & ©. 
Та(х.) | Рагепе (х!) | В(х,) Б(х) ... вб 
Та(х>) | Рагепе (х>) | Н(х2) Б(х>) ... 6 





1(ха) | Рагепе (ха) | в) Са) и(Ха) 

Можно было бы сказать, что результат оператора ЗЕТЕСТ на произвольном классе с; — это 
результат применения операций реляционной алгебры и/или операций группировки и сортировки 
над отношением \4;. Однако с отношением 3, связана проблема практической интерпретации. 
Возникает она из-за того, что информативный на классе атрибут в общем случае может прини- 
мать на его экземплярах значения, по сути являющиеся множествами значений °итр/е-типов дан- 
ных. Если информативный атрибут на каждом экземпляре класса принимает строго одно значение 
итр/е-типа, то, согласно [1], он называется ординарным, в противном случае — множественным. 
Причем, если атрибут определен на классе как ординарный, то он является множественным на 
его классах-предках. Проблема собственно заключается в интерпретации множественных атрибу- 
тов, если они входят в 5.. 

Как вариант решения проблемы можно предложить ограничить множество атрибутов, из 
которых строится %,, только ординарными на классе с. Обозначим 9={Ие 3, УхеЕхЕс) |Е(х)|=1}. 
Допустим, что для произвольного класса с, существует 9; = {Е №... }, КеМ. Тогда в отношении °\, 
каждый экземпляр х класса с, порождает ровно один кортеж (Та(х), РагепКх), #(х), Ь(х),..., &(х)) и 
никаких других кортежей не содержится: 

14 | Раге | в ©... № 
та(х!) Рагепё (х!) Е (х!) Ъ(х!) ЗЕ Вх!) 
140) РагепЕё (х2) Е (х2) Ъ(х2) а В (>) 





1А(хе) | Рагепе (ха) | в(жа) Ь(ж) ®(Ха) 
Недостаток данного решения - ограничение выразительной мощности оператора ЗЕЁЕСТ. 
На практике множественные атрибуты могут интерпретироваться как коллекции. В этом 
случае отношение °%, можно переопределить посредством функции кодирования Соде: В(Р)>М, 
определенной в булеане множества Р значений эитр!е-типов данных. Тогда в отношении *\, каж- 
дый экземпляр х класса с, порождает ровно один кортеж (Т4(х), РагепКх), Соде(Ё(х)), 
Со4е(+.(х)),..., Соде(Е„(х))) и никаких других кортежей не содержится: 
14 | Рагепе | ый Р ее и 
Та(х!) | РагепЕ (х.!) | Соде((х,)) Соае((х,)) ... Соде(и(х,)) 
Та(х>) | РагепЕ (х») | Соде((х>)) Соае((х>)) ... Соде((хо)) 





14(ха) | РагегеЕ (ха) | Соае(&(ж)) Соде((ж)) Соае(Е„ (ха) ) 
Проблематичность этого решения заключается в том, что для обработки результата 
ЗЕСЕСТ реляционных операторов будет недостаточно. Потребуются раскодирование и перебор- 
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ные операции, которые могут быть реализованы только на императивном или функциональном 
языке и, возможно, только процедурно. Это приведет к необходимости совместного использова- 
ния различных парадигм программирования, что усложнит как семантику, так и практическую 
реализацию оператора $ЕЁЕСТ. 

Последний вариант решения проблемы множественных атрибутов заключается в снятии 
неявного требования функциональной зависимости атрибутов Ё№,...Ёи от 14 в отношении 3. От- 
ношение '\, ограничим таким образом, что каждый экземпляр х; класса с, продуцирует в отноше- 
нии 54, множество кортежей равное декартову произведению значений функций 14, Рагег\, Ё, Ь,..., 
| „ на этом экземпляре. Пусть с, — произвольный класс в базе данных, ЕхКс)) = {Хи,Хо,...,Ха}, 9 Е М- 
множество его экземпляров в определенный момент времени, 3; = {Ё/№,../{и}, т е М — множество 
информативных на нем атрибутов. Тогда можно построить отношение: 


в, ла(х хРагеши(х, 6 (х, *& (х, }х... ХЕ, (х,) 7 (1) 


Продемонстрируем построение %, на примерах. Предварительно заметим, что число ин- 
формативных на классе атрибутов бесконечно, поскольку бесконечно число атрибутов, порож- 
даемых операциями. Поэтому в рассматриваемых примерах (и только в них) ограничим множество 
9; атрибутами потока класса, который в любой момент существования базы данных конечен. До- 
пустим, имеется класс с!, содержащий экземпляры х! и х», и на нем определены атрибуты # и 6. 
При этом 14(х,) = 91, 1а(х>) = 92, В(х!) = {1,0}, Б(х!) = 10, В(х>) = 1, 6(%) = 20. Тогда отношение 
\\‚, построенное на классе с!, будет выглядеть так: 





ав © 
9111 10 
9110 10 
9211 20. 


Теперь добавим в предыдущий пример класс с›, который наследует от класса с!. Допус- 
тим, что с› содержит экземпляры Хз, Х4 И Х и 14(хз)=93, 1а(х.)=94, Та(х-)=95. При этом хз и х. на- 
следуют от экземпляра х! класса си, а х- наследует от х»›. На с› определен атрибут В: Ё-(хз)=300, 
Е3(х4)=400, Е.(х5)=500. Тогда отношение \3:, построенное на классе с:, будет таким: 








ан © в 

911 10 300 
9111 10 40 
9110 10 300 
9110 10 400 
9211 20 500. 


Отношение %», построенное на классе с», будет выглядеть следующим образом: 
Т4 | РагепЕ Е Ь В 





93 91 110 30 
93 91 0 10 30 
94 91 110 400 
94 91 0 10 40 








95 92 1 20 500. 

В последнем примере добавим к классам с; и с› класс сз с экземплярами хе и х/. Допустим, 
что 14(хё)=10, а 1а(х›)=20. На сз определен атрибут №: 4(х6)=1000, Ё(х7)=2000. Кроме того, атри- 
бут Ь, определенный на с!, будем трактовать как ссылку на класс сз. Тогда на сз определен рас- 
четный атрибут Е=Тпу(с:,Ь), что, согласно [1], означает обратную ссылку на класс с», 
полученную в результате операции инволюции. Тогда отношение %!, построенное на классе с:, 
таково: 
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ан © 6 56.6 





91| 1 10 300 1000 
91| 1 10 400 1000 
9110 10 300 1000 
9110 10 400 1000 





92 11 20 500 2000. 
Отношение %»>, построенное на классе с›: 
Т4 | РагепЕ Е Ь В >.“ 
93 91 1 10 300 1000 











93 91 0 10 300 1000 
94 91 1 10 400 1000 
94 91 0 10 400 1000 
95 92 1 20 500 2000. 


Отношение “Уз, построенное на классе сз: 
а & ББ ББ В. 





10 | 1000 91 1 300 
10 | 1000 91 0 300 
10 | 1000 91 1 40 
10 | 1000 91 0 40 





20 | 2000 92 1 500. 

Главным недостатком последнего из предложенных здесь вариантов решения проблемы 
множественных атрибутов является «скрытая угроза» экспоненциального возрастания мощности 
результирующего отношения при увеличении числа таковых в запросе. Угроза является скрытой, 
поскольку декартово произведение при формировании результатов запроса выполняется неявно 
в зависимости от свойств атрибутов. Запрос, выдающий практически неприемлемый по мощности 
результат, в языке МОЁ выглядит довольно «невинно», в отличие от $О(, где аналогичный запрос 
будет иметь более громоздкую конструкцию с явным указанием операции соединения, продуци- 
рующей декартово произведение. 

Тем не менее, мы предпочитаем предоставить программистам возможность ошибаться, 
чем делает невозможным решение некоторых задач, как в первом варианте, или же совмещать 
различные парадигмы программирования с непредсказуемым эффектом, как во втором. Необхо- 
димо только предупредить программистов о «скрытой угрозе», и количество ошибок не будет 
слишком большим. 

Таким образом, здесь и далее мы будем использовать для ЖК, последнее определение. Это 
подразумевает, что в любой нашей реализации МОЁ оператор ЗЕТЕСТ будет иметь следующую 
семантику: 

$51. Результат применения оператора $ЕЁЕСТ к произвольному классу с, — это всегда неко- 

торое отношение, полученное путем последовательного применения операций реляционной ал- 
гебры и/или операций группировки и сортировки над отношением 3, которое определяется вы- 
ражением (1). 
Семантика предложений оператора $ЕТЕСТ в МОЕ. В соответствии с правилом $1 результат 
оператора ЗЕЁТЕСТ на классе можно представить как результат применения операций реляцион- 
ной алгебры и/или операций группировки и упорядочивания к отношению, содержащему значе- 
ния информативных на этом классе атрибутов. Здесь и далее мы будем использовать операции 
реляционной алгебры Кодда. 

Еще в «Третьем манифесте» [4] были четко сформулированы признаки нереляционности 
ОЕ. И хотя авторы манифеста посчитали это недостатком $01, практика показала обратную кар- 
тину: для выражения многих важных классов информационных запросов одной реляционной ал- 
гебры недостаточно. Хотя следующее высказывание может показаться противоречащим преды- 
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дущему, мы поддерживаем мнение Дейта и Дарвена, что нереляционность ОЕ - это «зло». Но, 
хотим мы этого или нет, от этого «зла» никуда не деться. Во-первых, мы не можем уйти от упоря- 
доченности результата запроса — порядок как по столбцам, так и по строкам часто критически 
важен не только для представления, но и для программной обработки результата запроса. Во- 
вторых, устранение кортежей-дубликатов в некоторых случаях приводит к невыразимости ин- 
формационной потребности в запросе. В-третьих, многие аналитические запросы оперируют 
сгруппированными таблицами, которые нельзя получить посредством операций реляционной ал- 
гебры над исходным отношением. Поэтому мы сознательно вводим операции группировки и упо- 
рядочивания, семантика которых определена в стандарте 50 Т5ОЛЕС-9075-01:2008 [5]. 

Кроме того, условимся обозначать пате(7) — имя объекта 7 (атрибута или класса) в базе 
данных в произвольный момент времени. 

$52. Предложение ЕКОМ оператора ЗЕЪТЕСТ определяет класс, на котором выполняется 
этот оператор. 

$3. Предложение ЗЕТЕСТ оператора ЗЕТЕСТ на классе с, реализует операцию проекции 
реляционной алгебры на отношении 3}, (при этом явно задается порядок столбцов в результате): 

ЗЕСЕСТ пате(А), пате(В),.., пате(С) 

РЕКОМ пате(с)> 


РВОЗЕСТ КА, В,...,С}, 
где А,В,..,С — атрибуты, информативные на с. 
Примечания: 


1. В операторе “$ЕЪЕСТ * ЕКОМ пате(с,)” символ “*” — это сокращенная запись имен атри- 
бутов, определенных на с. 

2. В операторе “ЗЕЪЕСТ ОТЗТИМСТ пате(А), пате(В),.., пате(С) ЕКОМ пате(с)” из резуль- 
тата выборки устраняются кортежи-дубликаты. 

3. В операторе “ЗЕТЕСТ ОТУИМСТ пате(А) Аб “<имя>” ЕКОМ пате(с,)” имени атрибута А 
явно задается значение <имя>. 

4. Предложение \М/НЕВЕ может содержать функцию ЕХТ(пате(с,)), возвращающую множе- 
ство идентификаторов класса или категории с. 

54. Предложение \/НЕКЕ оператора $ЕЁЕСТ на классе с, реализует операции ограничения, 
пересечения, объединения и вычитания реляционной алгебры на подмножествах отношении 3+: 

ЗЕСЕСТ пате(А), пате(В),.., пате(С) 

РЕКОМ пате(с) 

М/НЕКЕ фФ-> 

РКОЗЕСТ ХА, В,...,С} \МНЕВЕ к, 

где фФ - предикат, определенный на \\;, синтаксис которого описывается нетерминальным символом 

<условие>. 

ЗЕСЕСТ пате(А), пате(В),.., пате(С) 

РЕКОМ пате(с) 

М/НЕВЕ ф! АМО ф› > 

РВОЗЕСТ \КА,В,...,С} \МНЕКЕ ф, ПМТЕК$ЕСТ 

РКОЗЕСТ КА, В,...,С} \МНЕВЕ к›, 

ГДе ф1, ©> - предикаты, определенные на “\.. 

ЗЕСЕСТ пате(А), пате(В),.., пате(С) 

РЕКОМ пате(с) 

М/НЕВЕ ф! ОКВ ©› > 

РВОЗЕСТ \КА,В,...,С} \МНЕВЕ ®: УМОМ 

РКОЗЕСТ ХА, В,...,С} \МНЕВЕ ‹2. 

ЗЕСЕСТ пате(А), пате(В),.., пате(С) 

РЕКОМ пате(с) 
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М/НЕВЕ МОТ © 

\\; МПМУ$ РВОЗЕСТ АКА, В,...,С} \МНЕКЕ р. 

Примечание. 

В операторе” ЗЕТЕСТ пате(А), пате(В),.., пате(С) ЕКОМ пате(с,) 

М/НЕВЕ пате(А) 1М пате(В) “ запись “ пате(А) 1М пате(В)” выражает предикат, который 
истинен на кортеже, если значение атрибута А является нестрогим подмножеством значения ат- 
рибута В в этом кортеже. 

$55. Предложение СКОУР ВУ оператора $ЕЁЪЕСТ на классе с, реализует нереляционную 
операцию группировки (выделение реляционного множителя со сверткой на нем значений атри- 
бутов агрегатными функциями) на отношении 5%; или его подмножестве: 

ЗЕСЕСТ пате(А),..., пате(В),.., АСВ(пате(С)),..., АСВ(пате(О)) 

РЕКОМ пате(с) 

СКОУР ВУ пате(А),..., пате(В) > 

СКОУРМС °ЗКА,...,В) МИТН (АСК(С),..., АСК(О)), 
где АСК - агрегатная функция (СОУМТ| МТМ| МАХ| АУС| 5УМ). 

Примечание. 

Оператор “5ЕТЕСТ АСВ(пате(С)),.., АСВ(пате(0)) ЕКОМ пате(с;)” неявно формирует 
сгруппированную таблицу, содержащую ровно один кортеж, в которой происходит свертка значе- 
ний атрибутов С,...,О всех кортежей исходной таблицы. 

$56. Предложение НА\ММС оператора $ЗЕТЕСТ на классе с, реализует операции ограниче- 
ния, объединения, пересечения и дополнения реляционной алгебры на отношении, полученном в 
результате группировки “; или его подмножества. 

ЗЕСЕСТ пате(А),..., пате(В),.., АСВ(патЕ(С)),..., АСВ(пате(О)) 

РЕКОМ пате(с) 

СКОУР ВУ пате(А),..., пате(В) 

НАММС © —> 

СКОУРМС `ЗКА,...,В) МПТН (АСК(С),..., АСК(О)) 

М/НЕВЕ о, 
где фФ - предикат, который определен на результате группировки. 

57. Предложение ОКРЕК ВУ оператора 5ЕЁЕСТ на классе с, задает отношение алгебраиче- 

ского порядка на кортежах подмножества отношения 33;. Сортировка осуществляется по возраста- 
нию значений атрибутов, перечисленных в предложении ОВКРЕК ВУ в том порядке, в котором они 
перечислены. Если перед именем атрибута указано слово ОЕЗС, то сортировка по этому атрибуту 
осуществляется по убыванию. 
О полноте оператора $ЕЦЕСТ в МОЕ. Язык запросов, представленный в МОЁ оператором $Е- 
ГЕСТ, вычислительно не полон. Здесь можно выполнить транзитивное замыкание, но некоторые 
частично рекурсивные функции, в которых последующие значения вычисляются по предыдущим, 
неизвестным на момент начала вычислений, средствами МОЁ описать нельзя. Мы расцениваем 
это, скорее, как достоинство, поскольку, с одной стороны, подобные функции, как и любые дру- 
гие, можно реализовать на вычислительно полном языке, императивном или функциональном, и 
получать их значения в операторе 5ЕЪЕСТ с помощью вызова. С другой стороны, вычислительная 
неполнота языка позволяет надеяться на разрешимость его синтаксически-правильных конструк- 
ЦИЙ. 

Язык запросов в МОЁ реляционно не полон. Все базовые операции реляционной алгебры 
Кодда, за исключением декартова произведения, и производным от нее операциям соединения и 
деления, реализуются правилами $3 и $4. 

Что же касается декартова произведения, то, согласно (1), оно уже частично реализовано 
в отношении 3, содержащем информативные на классе атрибуты. Можно показать, что произ- 
вольный класс с, в смысле №-модели данных представим в виде одного отношения г, или, в случае 


1012 


Вестник ДГТУ. 2011. Т. 11, № 758) 








если на нем определены множественные атрибуты одного основного г и нескольких дочерних 
отношений. При этом атрибут-ссылка в классе с, может быть представлен как внешний ключ, оп- 
ределенный на г или на дочернем отношении. Следовательно, любую схему базы данных $Н в 
смысле №-модели, не содержащую категорий, можно представить в виде некоторой схемы реля- 
ционной базы данных 5НК. Таким образом, из (1) и свойств операции композиции следует, что 
отношение %\, произвольного класса с, схемы 5Н содержит любое естественное соединение соот- 
ветствующего ему отношения г, в соответствующей реляционной схеме $ПВ. Однако в базе дан- 
ных может возникнуть потребность в соединении, не являющемся естественным. Или же могут 
возникнуть запросы, реализующие реляционный оператор деления. И эти запросы не будут выра- 
зимы на МОЕ. 

Можно, оставаясь в рамках М-модели данных, сделать язык МОЁ реляционно полным. Для 
этого достаточно позволить использование в операторе ЗЕЪЕСТ функции АЦ ((пате(с,)), возвра- 
щающей множество идентификаторов экземпляров класса или категории с; и являющейся изо- 
морфизмом функции Ех. В рамках описанной в данной работе концепции, когда % строится на 
множестве информативных на классе атрибутов, на функцию АЦ((пате(с;)) полезно наложить 
следующие прагматические ограничения: 

М1. В предложении $ЕЪЕСТ оператора $ЕЪЕСТ функция АШ((пате(с;)) может использо- 
ваться только как операнд теоретико-множественных операций 1ТМТЕВ$ЕСТ, М1МИ$ и УМОМ и аг- 
регатной операции СОИМТ, определенных в [1]. 

М2. В предложении \М/НЕВЕ оператора 5ЕЁЕСТ в качестве операнда сравнения функция 
АЦ((пате(с)) может использоваться только как операнд теоретико-множественных операций Т№- 
ТЕВЗЕСТ, М1МУ$ и УМОМ, агрегатной операции СОЧМТ, определенных в [1], или же самостоя- 
тельно. 

МЗ. Если функция АН((пате(с,)) является операндом операций ТМТЕВ$ЕСТ, М1МУ$ или ЦМ- 
ТОМ в операторе $ЕТЕСТ, определенном на классе с, то другим операндом должен быть атрибут, 
информативный на с, чья область значений содержит АМ((пате(с))), или, иначе говоря, другой 
операнд должен быть ссылкой на класс с; (если же с; — категория, то ссылкой на ее родительский 
класс). 

Введенные здесь ограничения не делает МОЕ реляционно полным. Для достижения реля- 
ционной полноты необходимо их снять. В этом случае отношения 33 различных классов совпадают 
и содержат все атрибуты, определенные в базе данных, и все атрибуты, производные от них, т.е. 
в операторе $ЕЁТЕСТ, построенном на любом классе, будут доступны значения атрибутов всех 
классов базы данных вне зависимости от того, насколько такая доступность вообще имеет смысл. 
Реляционная полнота в данном случае дает возможность порождать множество бессмысленных 
запросов. Такая же ситуация, благодаря конструкции подзапросов, наблюдается и в 501. Однако 
мы считаем ее проблематичной и поэтому в настоящее время полагаем, что ограничений М1 — 
МЗ необходимо придерживаться. Тем не менее, мы понимаем всю дискуссионность данного во- 
проса и необходимость его дальнейшего исследования. 

Теперь перейдем к проблеме невыразимости транзитивного замыкания в $ОЕ (транзитив- 
ное замыкание не реализовано в стандарте $ОЁ, но реализуется в промышленных системах 
управления базами данных с помощью конструкций, определенных в расширениях $О(, напри- 
мер, в РУ/$ОЕ или в Т-501). В МОЁ она решена, поскольку транзитивное замыкание выражается 
через рекурсивно вычисляемые расчетные атрибуты. Покажем это на хрестоматийном примере. В 
базе данных содержатся сведения о сотрудниках: табельный номер, имя, начальник. Под послед- 
ним понимается непосредственный начальник сотрудника. Необходимо выбрать всех руководите- 
лей (транзитивных начальников) для каждого сотрудника. 
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В базе данных сведения о сотруднике будут содержаться в классе (на МОГ): 

сгеае с!а55 еп у СОТРУДНИК 

аНиЬщез ТАБНОМЕР: уагспаг(32), 

ИМЯ: \уагспаг(128), 
НАЧАЛЬНИК: ех(СОТРУДНИК), 
РУКОВОДИТЕЛЬ = НАЧАЛЬНИК ипюп 
НАЧАЛЬНИК.РУКОВОДИТЕЛЬ 
ипаче (ТАБНОМЕР); 

Запрос на МОЕ, возвращающий для каждого сотрудника всех его руководителей, будет вы- 
глядеть так: 

эз@есЕ ТАБНОМЕР, ИМЯ, РУКОВОДИТЕЛЬ 

гот СОТРУДНИК. 

Заключение. Описаны синтаксис и семантика оператора $ЕЪЕСТ языка МОЕ и оценена его пол- 
нота. МОЁ базируется не на реляционной, а на объектной №-модели, и переход в данной работе к 
реляционной алгебре обусловлен только желанием авторов объяснить семантику оператора $Е- 
ГЕСТ в МОЁ с помощью формализмов, привычных и понятных большинству специалистов в облас- 
ти баз данных. 

При соблюдении введенных здесь прагматических ограничений М1 — МЗ язык МОЕ не яв- 
ляется реляционно полным, поскольку декартово произведение в этом случае ограничено. Снятие 
этих ограничений является дискуссионным вопросом, но позволяет сделать МОЕ реляционно пол- 
ным и даже более выразительным, чем стандарт 5ОЁ, поскольку в нем выразимо транзитивное 
замыкание. 
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ЗЕТЕСТ ЗТАТЕМЕМТ 1М М-ОЕСГАВАТТУЕ ТАМСУАСЕ 


О.М. ОЕКНОУТК 
(Роп За Тесртса! Упмег®Ку) 


5утах апа зетапйс$ оЁ {Те $Е1ЕСТ Е етепЕ т М№-Ресагайуе [апдиаде аге дезспреа, ТЕ 15 звоигп Ёпаё Гог еасй 
са5$ п {Те 5епзе оЁ М-аа тодЕ! пе ге/айоп сощаттд {те айтБие уа/иез п 5 пюгтайуе са5$ сап Бе Бий 
ир, апа {пе $ЕТЕСТ 5ЕйетепЕ /тр/етепёз те ге/авопа!/ а/де6га орегаНоп$ апа о{ТеГ 5реса! орегаНоп$ оп те 
5ирзеЁз ОЕ 5 ге/аНоп$Нр. 
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